AI“冷门”方向背后的产业升级大机会 | 华为廖恒博士谈《人工智能的思考》
由北京科学智能研究院(AISI)主办的AI for Science系列学术讲座,于北京时间2022年6月8日(周三)15:30-17:00顺利举行。本次讲座主题为「人工智能的思考」,由华为 Fellow, 华为 2012实验室和海思首席科学家廖恒博士分享他对人工智能的思考和洞见。
本场讲座中,廖博士首先回顾了AI在热点领域已经取得的成就,进而将讲座的重点放在目前尚未被重点关注,但是具有深刻作用和研究意义的领域,包括:新科学计算和工业计算的新思路,计算机图形学与多媒体通路融合的新突破,Robotics实现自主性的新范式,结构化知识学习与推理的新理解,非线性信号处理:光通信中的新途径,天文领域快速射电暴识别的新方式和AI的物质基础。每一个领域廖博士都从领域现状入手讨论领域的核心挑战,并给出了利用AI解决领域问题的思路。
主讲嘉宾介绍
廖恒博士是华为Fellow、华为2012实验室和海思首席科学家。他直接领导计算处理器架构团队和平台软件团队以及专注于基础理论探索的CSTT委员会,是AI处理器和高性能CPU总架构师。他在半导体行业拥有超过20年的工作经验,最近的工作领域包括高性能服务器级CPU、AI处理器和一些计算理论研究,拥有30多项专利。
讲座视频回放
讲座精彩回顾
AI的「主流」大规模应用
随着大数据时代的到来,AI正在以惊人的速度融入到日常生活的众多方面。
廖博士从安防、手机、自动驾驶、互联网四方面展开,介绍了AI在实践中产生的巨大经济价值。在安防领域:随着AI技术在计算机图像(图像的增强、压缩与智能识别)以及大数据存储、读取和检索方面的提升,我国的安防工作取得了良好的效果;在手机领域:以手机随手拍为例,基于 AI 的图像处理方法保证了随手拍的照片的质量;在自动驾驶领域:AI技术深入到了环境的建模,道路车辆和障碍物的感知与预测,决策环节和控制系统,以及电池管理系统的每个环节中;在互联网领域:通过大数据分析而提取的各种用户特征的画像正在为我们推送更为个性化的内容,更加贴合我们的兴趣和需要,让我们获得更好的互联网体验。
AI未来重点的攻坚方向
AI技术虽然取得了很多成功,但是在这些热点领域中的成功应用也暴露出较为严重的同质化现象,大量的科研工作者在追随热点浪潮的时候,忽略了更加有意义的,但也更加困难的「攻坚」领域。从本质上说,深度学习、强化学习打破了传统计算机算法基于解析的框架,使得相关AI算法取得巨大成功。廖博士认为这种成功其实仅仅是一个开始,如果我们能把过去大师们涉及的理论和框架全部重新思考一遍,将会找到更多突破的方向。
在这些「攻坚」领域,廖博士从以下例子展开,对AI的应用潜力和前景进行了分析和探讨。
新科学计算,工业计算的新思路
廖博士以新应用数学为例,介绍了AI在新科学、新工业计算领域的应用潜力。应用数学解决问题的基本模式包括下面5个环节:
对领域问题进行数学建模;
找到求解问题的解析方法,或数值方法;
将求解问题的方法设计成计算机算法;
将算法编写成软件程序;
对算法和软件进一步迭代优化,实现大规模并行化
这5个环节中,对领域问题进行数学建模是非常重要并且可能存在巨大的突破的一步。在实际中几乎所有的建模都会遇到一些困难,比如存在无法建模的边界条件、物理公式的适用范围与现实不符合的情况以及无法表达的随机统计行为等重要问题。这些问题其实都是采用比较经典的应用数学来解决领域问题会遇到的典型困难,甚至是一个通用困难。
以光刻机的OPC(Optical Proximity Correction)过程建模为例,传统方法会对每一个透镜都建立一个物理模型并对模型进行叠加。这个方法在比较粗糙的精度下是准确的,但是当透镜逼近光学极限并且系统明显受到温度、透镜不完美等影响时,传统的建模方式就不再有效。针对这个问题,一个可能并且初步验证有效的尝试是,将深度神经网络模型(DNN)与传统物理模型相结合构造混合模型。可见在传统建模领域引入AI的方法,有可能带来很好的效果。
计算机图形学与多媒体通路融合的新突破
在计算机图形学中,真实图片的构建是来自于坐标系下3D几何模型的构建和渲染,然后在某个视角或者光照条件下,在几何面片和网格的条件下生成相应的像素而构成图像。在多媒体通路中, 从真实世界中采集到信息是通过彩色滤光片阵列、传感器、一系列后处理(去马赛克化、白平衡、伽马校正)去生成相应的图像。这两种生成图片的方式在20多年来一直是平行发展的。随着AI技术的广泛应用,这两种方式第一次出现了跨界融合。
在传统的计算机图形学中,渲染方法都是对照相机拍照的光学过程进行数学物理建模来实现的,包括光栅化(rasterization),光线追踪(ray tracing)。而NeRF及其众多follow-up工作使用深度学习的方式进行渲染。渲染的过程是将3D 物体和场景的模型直接视作一个函数,这个函数的输入值是入射光线,输出的是表示具体图片的、带有颜色、强度以及方向信息的反射光线。通过AI学习这个映射关系,可以除去几何要素,直接连接3D模型与图像。这种跨界技术的融合为多媒体、图形学甚至元宇宙的发展提供了新的可能性。
Robotics实现自主性的新范式
AI技术的广泛应用不禁让我们思考是否可以将AI技术赋予一台机器?目前,智能机器人的应用能力是非常单一和有限的,无法发挥自主性去完成独立的任务。传统的机器人控制方法是基于精确的坐标系,通过传感器以及相应的传感算法,对机器人所处的状态以及环境进行建模,包括位置的坐标、相应的动作、状态等,去构建高维坐标。这样便可以训练并构建一个机器人动作预测模型,去规划机器人每一步动作发生的具体方式和途径,包括路径、平移的距离、角度等。这些数据会输送给PID,配合马达控制器加以执行。但是这样的控制方法导致智能机器人远不及生物的能力。
受到AI技术在计算机图形学中突破性应用的启发,智能机器人的控制方法可以同样建立一个非坐标系统的图形式的控制系统,使机器人用生物体的方式将观察学习到的内容通过端到端的模型训练来直接执行相应的动作。例如,在训练机械臂成为专业棒球手的过程中,可以通过给机械臂无数次地投掷各种各样的球,促使机械臂产生相应的动作去完美击中棒球,从而使得机械臂在真实的棒球比赛中取得职业棒球手的表现。这样的训练方式已经初步证明有效。
结构化知识学习与推理的新理解
在互联网时代,大数据往往是动态的、相互关联的、非结构化的文本。因此许多人工智能大师,反对结构化知识的学习,认为以需求为导向的片段化信息摄取更有助于AI达到最好的学习效果。但是人类几千年来的文明发展恰恰是从片段化的信息中提炼并沉淀出结构化的知识的过程。特别是语言文字这一结构化符号系统的出现,极大地促进了信息的传播速度,并且突破了时空限制,直接把人类文明和知识累积推向了一个快车道,实现了指数爆炸式的发展。因此结构化知识学习与推理可能是AI技术发展的终极问题。
AI的发展受限于数据、算法、算力以及应用需求四个方面。在目前的应用场景中,数据往往是充足的、算力都是可以获得的、AI也有着广阔的应用场景和发展前景,最大的突破口在于AI方法的突破。结构化知识学习与推理是一种有效的实现AI方法突破的途径。
在知识学习系统中,可以使用一个带有权重的映射网络去实现结构化知识的高效表达,并且结构化的知识需要真实地对应生活场景中的具体对象。此外,该系统需要具备一定的记忆能力,能够将新知识不断地添加到这个知识系统中。在此基础上,该系统要能够使用已有的知识库对新的问题不断地进行反复的推理和求解。这种基于结构化知识的AI已经在搜索引擎上展示出了优秀的能力,使得搜索引擎能够对一些需要进行推理的问题直接给出答案。
在提高AI的推理和预测能力中,数学符号的演算和定理证明也是一种有效的方式。在学习数学符号的演算和定理证明中,AI可以学习人类运用有限的知识、凭借繁复的技巧和思考而实现的问题求解能力。这种将有限知识无限延伸的能力有助于AI在更多开放领域实现自动化的探索、学习和预测。
目前,AI技术已经在简单的演算过程和定理证明中有着出色的表现,例如三角函数的符号演算和小学数学应用题的求解。进一步的发展目标是期望AI能够将高等数学里面的所有定理完全自动地证明出来,这样AI技术就可以具备相当高的知识应用能力。
非线性信号处理:光通信中的新途径
在光通信的光电路转化系统中,因为非线性物理信号的存在所导致的动态损伤以及损伤间的相互耦合,经典信号处理和建模的方法无法准确地对信号转化过程进行建模,而存在着较高的误码率。
AI技术能够弥补光通信中物理模型的缺陷,为这一问题提供了新的解决途径--可以将光电转换系统视作一个非线性的波形变换的函数,通过AI方法直接预测波形变换,从而通过波形的形状去解析会产生的特定效果。此外,AI技术能够在仿真的初期就识别出信号模式中是否存在非线性信号,并且采用相应的补偿算法。相比于依靠操作人员识别,这种基于AI的方法更加准确和高效,特别是考虑到非线性信号往往是微观的,难以直观察觉的。
天文领域快速射电暴识别的新方式
在天文领域,天眼装置有着瞩目的信号接收和采集能力,发现了脉冲星、射电暴等诸多天文现象。但是它的信号处理能力远远比不上它的信息采集速度。
在传统的信号处理过程中,天眼使用时间频谱的形式去构建含有距离这一未知量的物理模型。考虑到不同频率的波具有不同的速度,在时间-频率的频谱信号中会有不同的斜率,科学家可以通过色散值网格化遍历、下采样网格化遍历、在时间轴上进行高斯拟合来求解相应的天文距离。但是这种方法计算代价十分高昂并且效率低下。
如今,AI技术为这一问题提供了新的解决方式--将已经确定的天文信号样本进行标注和学习,通过把信号图形化的方式直接判断波形的形状,从而求解天文距离。针对这种具有大量未标注的数据的问题,半监督的AI方法(Semi-supervised)有着良好的表现。例如,「蒸馏学习」能够在去色散的数据上进行学习和训练,然后将模型进行迁移,从而对未去色散的数据进行预测和判断。这种算法达到了色散盲搜,大大缩短搜索所需要的时间,甚至可以实现实时搜索。同样地,半监督的PU算法将未标记的数据混杂在已标注的样本里面,以较小的训练成本对大量未标注的数据中进行了有效的探索,额外发现了更多有效的脉冲信号,提高了探测效率。
AI的物质基础
AI技术的高速发展是离不开物质基础的。正如 CPU 发展中的物质基础的体系包括:单片机、PC、服务器以及超算中心。在AI发展中,也需要构建这样一个从0.1$到10亿$的物质基础,在坚固物质基础的保障下,AI才有可能实现高速的发展。
更多关于「AI for Science」的前沿讨论,欢迎关注2022首届科学智能峰会。大会由AISI主办、深势科技承办,将邀请多位院士、科研专家、前瞻投资人、企业领袖等学术界、产业界重量级人物汇聚一堂,跨界融合,通过报告分享、圆桌讨论及多场主题分论坛活动,共创「AI for Science」新未来!大会将于六月下旬到七月上旬在北京与您见面,同期还将发布AI4S全球发展报告。扫描下方二维码获取大会稀缺入场券!
敬请持续关注大会主办方官方微信公众平台【科学智能AISI】或【深势科技 DP Technology】,第一时间获取大会最新举办时间、大会资讯及各项论坛精彩内容。
关于 AISI
北京科学智能研究院(AISI)成立于2021年9月,由鄂维南院士领衔,致力于将人工智能技术与科学研究相结合,加速不同科学领域的发展和突破,推动科学研究范式的革新,建设引领世界的「AI for Science」基础设施体系。
AISI的研究人员来自国内外顶尖高校、科研机构和科技企业,共同聚焦物理建模、数值算法、人工智能、高性能计算等交叉领域的核心问题。
AISI致力于创造思想碰撞的学术环境,鼓励自由探索和跨界合作,共同探索人工智能与科学研究结合的新可能。
- End -
(如需转载图文请与公众号后台联系)
-------------------------------
推荐阅读